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E RESUMEN. Los métodos de ordenación son herramientas multivariadas muy 
utilizadas en la Entomología. En este foro se presenta una introducción a éstos 
y breves explicaciones sobre distintas Técnicas: Análisis de Componentes Prin- 
cipales (ACP), Análisis de Redundancia (AR), Análisis de Correspondencia. 
(AC), de Correspondencia Canónica (ACC) y de Correspondencia Detenden- 
ciada (ACD), Análisis de Coordenadas Principales (AcoP), Análisis Factoriales 
(AF), Modelos de Ecuaciones Estructurales (MEE) y Método de Procrustes. 


PALABRAS CLAVE. Análisis de Componentes Principales. Redundancia. Co- 
rrespondencia. Correspondencia Canónica. Correspondencia Detendenciada. 
Coordenadas Principales. 


E ABSTRACT. Application of Multivariate ordenation methods in Entomo- 
logy. Ordenation methods are multivariate technics used a lot in Entomology. 
At this forum is presented an introduction to ordination methods and a short 
explanation over different technics: Principal Component Analysis (PCA), Re- 
dundancy Analysis (RA). Correspondence Analysis (CA). Canonical Correspon- 
dence Analysis (CCA). Detrended Correspondence Analysis (DCA) Principal 
Coordinate Analysis (PcoA). Factor Analysis (FA), Structural Equation Models 
(SEM) and Procrustes method. 


KEY WORDS. Principal Component Analysis. Redundancy. Correspondence. 
Canonical Correspondence. Detrended Correspondence. Principal Coordinates. 


INTRODUCCIÓN 


Puede resultar muy poco novedoso comenzar 
este artículo con una sentencia como: “la natura- 
leza es muy compleja”. Pero aunque esta frase 
tan utilizada diera lugar a una sonrisa, podemos 
convenir que es cierta. Cuando un investigador 
observa o intenta explicar los eventos que ocu- 
rren en la naturaleza, comienza por tomar carac- 
terísticas aisladas, es decir de a una por vez. Ade- 
más, en el afán de cumplir con el principio de 
parsimonia y que las explicaciones sean biológi- 
camente coherentes, utiliza muy pocas caracte- 


rísticas o variables independientes que expliquen 
a otras, dependientes. Esto es apoyado por toda 
una batería de análisis de la Estadística, que po- 
demos denominar Estadística univariada. 

Qué ocurre cuando el investigador ávido de 
conocimientos quiere más y no se conforma con 
sólo una variable. Si ésto pasara por vuestras 
mentes, entonces la solución a vuestras inquietu- 
des tiene nombre y apellido: Análisis Multivaria- 
dos, un conjunto de técnicas y análisis que utilizan 
muchas (dos o más) variables a la vez. 

Las variables se definen como las característi- 
cas que les poseen las unidades de observación 
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(el objeto de estudio). Cada unidad posee un sin- 
número de variables, pero el investigador sólo to- 
ma o mide las que le serán útiles a sus objetivos. 
Las variables pueden ser de varios tipos: Cualita- 
tiva Nominal, como Presencia-Ausencia, sexo, 
coloración, forma de la mina de un minador 
(Agromyzidae), etc. Cualitativa Ordinal, como la 
especificidad alimentaria de una categoría taxo- 
nómica (monófagas, oligófagas y polífagas, esta- 
dios larvales, etc.) Cuantitativa Discreta, como 
número de huevos, número de antenómeros, días 
hasta la pupación, número de parasitoides, de 
huéspedes, de especies, etc. Cuantitativa Conti- 
nua, como largo del ala, distancia recorrida, peso 
de las ovariolas, etc. 


Algunos conocimientos preliminares. En pri- 
mer término cabe acotar que en los análisis de 
Ordenación (más adelante daremos su definición) 
se le dará a todas las variables el mismo peso, por 
lo que si una variable fue medida en metros, otra 
en cm, otra en mg x I", los análisis tomarán sus 
respectivos valores y la escala en que están medi- 
das algunas, llevará la atención de todo el análi- 
sis. Por otra parte si algunas poseen mucha varia- 
bilidad y otras muy poca, toda la atención se la 
llevará la variable con mayor dispersión en los 
datos. Para observar esto, antes de realizar los 
análisis pertinentes, los investigadores deben rea- 
lizar la mayor cantidad posible de análisis des- 
criptivos y gráficos preliminares. Nadie mejor que 
el “ dueño” de los datos para conocer la posición 
y dispersión, simetría y distribución de cada una 
de las variables en estudio. A ésta información se 
la complementa con gráficos de cajas (box-plot) 
en busca de datos anómalos (outliers) que deben 
ser identificados. Nótese la palabra identificar y 
no eliminar. Un dato anómalo NO se debe elimi- 
nar sólo por el hecho de identificarlo, debe exis- 
tir una razón biológica para su eliminación. Por- 
qué vamos a discriminar a un dato “rarito”?, por- 
que no es como la mayoría?. 

Por otra parte resulta interesante realizar gráfi- 
cos de dispersión (tipo xy) de a dos variables a la 
vez para “ver” como se van relacionando de a pa- 
res. Por último existen herramientas descriptivas 
multivariadas como perfiles multivariados, gráfi- 
cos de estrellas, etc. que muestran patrones gene- 
rales tomando todas las variables a la vez (John- 
son & Wichern, 1998). 

Con el objeto de quitarle peso relativo a algu- 
nas variables o para que se cumplan ciertos su- 


puestos, el investigador puede realizar transfor- 
maciones a los datos originales, con ello se trata 
de aplicar un cambio de escala en cada elemen- 
to de la variable, independientemente de otro. 

Existen varios tipos de transformaciones, cada 
una con objetivos diferentes, siendo las más co- 
munes: 


Logaritmos: y¡= Log (xij+1), donde y; es el va- 
lor transformado, xij es el valor original. 

Se utiliza normalmente para conseguir distri- 
buciones simétricas en aquellas asimétricas a la 
derecha. También se utiliza para “acercar” los da- 
tos que se hallan lejanos hacia la derecha del eje 
cuando se presenta un alto grado de variación 
entre las variables o cuando dentro de una de 
ellas hay mucha variación. La forma mas común 
de realizar esta transformación es sumar previa- 
mente al dato original una constante (uno) ya 
que si hay datos ceros, el logaritmo de cero no 
está definido. 


Transformaciones de Potencia (Power transfor- 
mations): yij= (xiH)P, donde O<p<9. 

Podemos diferenciar la transformación cuando 
p<1, de aquella donde p>1. En la primera esta- 
mos hablando de una raíz que se utiliza, al igual 
que el logaritmo, para “traer” datos lejanos. En el 
segundo caso es la potencia tal como la conoce- 
mos, y se la utiliza para hacer simétrica distribu- 
ciones que son asimétricas a la izquierda. 


Arcoseno: yij=VAsen (pij), donde pj es la pro- 


porción 
Se utilizan para normalizar las proporciones. 


Relativizaciones: 
Se utilizan para cambiar la escala de un valor 
de la variable, en referencia a otros valores. 


Relativizada al máximo o al total: yi= xij/ max xj 
Es la proporción de un valor con respecto al 
máximo valor observado o a la suma de éstos. 


Ajustada a la media: y¡= xij — X 

Se utiliza para quitarle el peso relativo de ca- 
da variable, ya que se consigue una variable con 
media cero, pero conserva la varianza y la forma 
de la distribución. 


Estandarización (ajustada a la media y al 
desvío): 
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Tabla 1: Ejemplo de la estructura de la Matriz de datos, de Varianzas-Covarianzas y Correlación. Se observa una 
matriz original con tres variables tomadas a cinco unidades de observación. 


Matriz original de datos X,,,, 


Matriz de Varianzas-Covarianzas S,,, 


Matriz de Correlación R,,,, 





donde n=5 y p=3 donde p=3 donde p=3 
1 2 5 25 3,5 -2,75 1 0,87 -0,74 
4 7 1 S=| 35 6,5 -5,25 R=| 0,87 1 -0,88 
X=} 2 1 6 -2,75 -5,25 55 -0,74 -0,88 1 
5 6 2 
3 4 6 
(xij — X) = . . 
Yi — gi , donde X; es la media de la variable se presentan las covarianzas entre las distintas va- 


y Si es el desvío. 

Se le quita el peso relativo y la variabilidad, 
todas las variables presentarán media cero y va- 
rianza uno. Pero se conservará la forma de la 
distribución. 

Es necesario acotar que la transformación de 
los datos no es un dogma de fe, hacerla no nece- 
sariamente soluciona todos los problemas. El 
transformar las variables tiene que perseguir un 
objetivo (Afifi & Clark, 1996). Después de realizar 
estos cambios en las variables se debe proceder a 
hacer nuevamente todos los análisis descriptivos 
para observar si se cumplieron los objetivos de 
este proceso. 


Algo de Matrices y Estadística. En textos de 
matemática se puede leer que una matriz es un 
arreglo de números en la forma de filas y colum- 
nas, o sea una tabla de doble entrada. Para reali- 
zar los análisis que nos convocan construiremos 
matrices de la siguiente forma: en cada fila se co- 
locarán cada una de las unidades de observación 
desde 1 a n. En cada columna, las variables, des- 
de la 1 a la p. Por lo tanto tendremos una matriz 
Xnxp donde n es el número de unidades de obser- 
vación y p el número de variables a considerar 
(Tabla 1). 

Recordemos que la varianza es una medida de 
dispersión de todos los datos con respecto a su 
propia media. La covarianza, por su parte, es la 
variación conjunta de dos variables a la vez. Se 
puede considerar a la covarianza como una va- 
rianza entre dos variables, y a la varianza como 
una covarianza de una variable consigo misma. 
Con la matriz X de datos se puede construir una 
matriz Spxp (matriz de varianzas-covarianzas) 
donde en su diagonal principal se observan las 
varianzas de cada una de las variables y en los 
triángulos de la matriz hacia arriba y hacia abajo 


riables (Tabla 1). La suma de las varianzas de la 
diagonal principal es la varianza total de la ma- 
triz. 

El índice de correlación de Pearson entre dos 
variables se define como el cociente entre la co- 
varianza y el producto de los desvíos. Si se divi- 
de a cada uno de los números de la matriz S por 
el producto de los desvíos correspondientes, se 
obtendrá una nueva matriz Rpxp llamada matriz 
de correlación, donde en la diagonal principal se 
presentan todos los unos (correlación entre una 
variable y ella misma) y en los triángulos, las co- 
rrelaciones entre cada par de variables (Tabla 1). 


DE LO PARTICULAR A LO GENERAL 


Ejemplo 1: Análisis de Componentes Principa- 
les (ACP). 


Supongamos que un investigador está estu- 
diando un género de mosquitos, y toma dos va- 
riables a cada individuo (unidad de observación): 
largo del ala y largo del cuerpo (ruego a los espe- 
cialistas no sonreír por la simplicidad del ejem- 
plo). Si la combinación de estas dos variables pu- 
diera separar a algunas especies, entonces re- 
sultaria interesante dibujar todas las unidades de 
observación en un espacio de dos dimensiones. 
Entonces se realizaría un gráfico de dispersión, en 
dos dimensiones, como el de la Figura 1. Ahora, 
si el investigador toma tres variables, las unidades 
de observación son dibujadas en un espacio de 
tres dimensiones, si fueran 10 variables estarían 
en 10 dimensiones y generalizando: en p varia- 
bles, corresponderían p dimensiones. Resulta 
prácticamente imposible encontrar patrones o 
grupos de individuos en más de tres dimensiones. 
Por ello se deben utilizar herramientas para ex- 
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Figura 1: Gráfico de dispersión entre el largo del cuer- 
po y largo del ala largo de un género de mosquito. 


traer conclusiones a partir de muchas dimensio- 
nes, es decir con todas las variables. Si volvemos 
a dos dimensiones veremos que una manera sen- 
cilla de encontrar un patrón es ver en qué sentido 
se presenta la máxima dispersión de datos. Este es 
el eje de mayor variabilidad de los datos y se 
construye pasando una recta de modo tal que se 
maximice la dispersión de datos en un sentido y 
se minimice la distancia de todos los puntos a és- 
ta (Figura 2). Esto es lo que conocemos como au- 
tovector, vector propio o eigenvector. Asociado a 
este autovector se presenta un autovalor, valor 
propio o eigenvalue, que da una idea de la mag- 
nitud (el largo) del autovector. Esa es una medida 
de la variabilidad que absorbe ese vector. Des- 
pués de ese eje de máxima variabilidad se tiene 
un segundo autovector, perpendicular (ortogonal) 
al primero y así sucesivamente hasta conseguir 
tantos p autovectores y autovalores como p varia- 
bles posee la matriz. 

Los autovalores y autovectores no surgen a 
partir de un dibujo, sino que se calculan a partir 
de matrices. Para ello se debe partir de una matriz 
original de datos Xnxp a partir de la cual se calcu- 
la la matriz Spxp. Si los datos originales han sido 
previamente estandarizados, lo que se obtiene es 
una matriz de correlación (R) donde se presentan 
los valores de los índices de correlación de Pear- 
son. Así como en un análisis de regresión ordina- 
ria (con método de mínimos cuadrados) se cons- 
truye una recta (eje), aquí ocurre lo mismo, pero 
la forma de construírlo es distinta. La fórmula del 
eje no tiene ordenada al origen y consta de una 
pendiente por cada una de las p variables. Enton- 
ces ese eje de mayor variabilidad está compuesto 
por una porción de la información de cada varia- 
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Figura 2: Gráfico de dispersión entre el largo del cuer- 
po y largo del ala largo de un género de mosquito don- 
de figura el eje que absorve la mayor variabilidad de 
los datos. 


ble, es lo que se llama una combinación lineal de 
las variables: 


CP¡= a11 Xı + ajz X2 FaF aip Xp 
CP2= a21 X1 + a22 X2 +... + a2p Xp 
CPp= ap1 Xi + ap2 X2 +... + app Xp 





Donde CPi: eje o componente principal, Xj: 
variables, aij: pendientes. 


Como se vio anteriormente la varianza total 
del análisis es la suma de las varianzas de cada 
variable. Entonces se tiene que la suma de los au- 
tovalores es igual a la suma de todas las varian- 
zas, es decir la varianza total. Por definición, los 
autovectores se presentan desde el mayor autova- 
lor al menor de éstos. El primer autovector va a 
absorber mucha variabilidad, el segundo menos y 
así sucesivamente, pero cuántos autovectores son 
suficientes para explicar gran parte de la variabi- 
lidad de la matriz?. Una regla práctica sencilla di- 
ce: Sólo sirven los autovectores que absorben 
más variabilidad que el promedio de las varian- 
zas (si se trabaja con una matriz de varianza-co- 
varianza) o si son mayores que 1 (si se trabaja con 
una matriz de correlación). Este criterio de deci- 
sión se denomina criterio de la raíz latente. (Ver 
otros criterios en Hair et al., 1995 y McGarigal et 
al., 2000). 

A partir de los autovalores escogidos se reali- 
zará un nuevo gráfico donde se ordenarán las 
unidades de observación. Allí se colocarán en los 
ejes x e y a los autovectores 1 y 2 y se observarán 
los patrones que presenta el gráfico: quiénes es- 
tán en los extremos?, se observan grupos?, cuán 
cerca están las unidades de observación?. Se pue- 
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Figura 3: Gráfico (Biplot) de un Análisis de Componentes Principales, donde figuran las unidades de observación 


y las variables. 


de realizar, además, otro gráfico solapado (biplot) 
donde superpone las variables. Estas se unen al 
centro del gráfico y dan una idea de cuán cerca 
están algunas variables de las unidades y cuán 
correlacionadas están las variables entre sí. Cuan- 
to más agudo sea el ángulo entre variables la co- 
rrelación es mayor, si el ángulo es de 90 grados la 
correlación nula y si es muy obtuso es una corre- 
lación inversa (Figura 3). 

Lo que acabamos de ver es el conocido Aná- 
lisis de Componentes Principales (ACP). Esta 
técnica forma parte de un grupo de métodos de- 
nominados de ordenación o de reducción de la 
dimensionalidad. Ordenan a las unidades de ob- 
servación y reducen de p dimensiones a pocos 
vectores que llevan gran parte de la carga de la 
información original. Los objetivos de estos aná- 
lisis apuntan a generar hipótesis y no a probarlas, 
por lo tanto no forman parte de la Estadística In- 
ferencial. 

Este Análisis es altamente recomendado cuando 
tenemos entre manos variables con distribuciones 


normales, más aún debieramos tener una matriz 
con distribución normal multivariada. Además de 
esto, el investigador no tiene información de gru- 
pos a-priori entre las unidades de observación. 
Debido a que utiliza una matriz de varianzas-co- 
varianzas, considera que entre las unidades de 
observación se presenta una distancia Euclídea, 
entonces los resultados obtenidos son equipara- 
bles a un dendrograma realizado con distancia 
Euclídea y un método de unión llamado de liga- 
miento promedio. 

A partir de los resultados la pregunta que sur- 
ge es: por qué razón algunos individuos se acer- 
can a otros?, y porqué son distintos los que están 
en los extremos de los ejes?. En parte esas pregun- 
tas pueden ser respondidas con las mismas varia- 
bles que generaron el análisis. Algunas tendrán 
mucho peso en el eje 1 y estarán correlacionadas 
con él, otras en el eje 2. De allí el investigador 
podrá conocer cuáles son las variables que for- 
maron parte del análisis que marcan mayores di- 
ferencias. Pero estos grupos que se han formado, 
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son reflejo de algún gradientes de algo?. Podría 
ser un gradiente geográfico?, ambiental?. Para 
contestar estas pregunta surge el Análisis de Re- 
dundancia, que consta de la utilización de varia- 
bles ambientales o anexas (que no fueron utiliza- 
das previamente en el ACP) para explicar esos 
gradientes. Se realizan regresiones con las varia- 
bles anexas oficiando de variables independien- 
tes y los componentes principales (como depen- 
dientes) con el fin de encontrar el modelo que 
mejor explique la ordenación de las unidades de 
observación obtenidas por el ACP. Dos son las 
formas de aplicarlo: mediante métodos de míni- 
mos cuadrados ordinarios o mediante análisis de 
permutación, que son regresiones del tipo no pa- 
ramétricas (Good, 2000, Mielke 8: Berry, 2001). 

Es recomendable utilizar Análisis de Compo- 
nentes Principales cuando se posee variables nor- 
males como en muchos casos son las medidas 
morfométricas. Por otra parte también se debe 
poseer una matriz con n>p, es decir más unidades 
que variables, aunque observando la bibliografia 
se intuye que esto muchas veces no se cumple. 
Dependiendo del objetivo del investigador, antes 
de realizar un ACP se pueden transformar las va- 
riables originales con los métodos descriptos ante- 
riormente. El logaritmo le quitará peso a los datos 
extremos, con la estandarización se obtendrá que 
todas las variables tengan el mismo peso y la mis- 
ma variabilidad, etc. 

Los entomólogos que trabajan en Ecología de- 
ben tener en cuenta que un supuesto muy fuerte 
del ACP es asumir linealidad en la relación espe- 
cie-gradiente. Entonces se debe utilizar sólo si los 
gradientes ambientales son “cortos”. En un gra- 
diente “largo” las especies tienen un valor óptimo 
donde son más abundantes, y a valores mayores 
o menores del gradiente ambiental son menos 
abundantes, y por lo tanto no debe ser utilizado 
en esos casos. 

Después de haber explicado el ACP podemos 
ver claramente que se denomina Ordenación a un 
diagrama en que las unidades de observación se 
presentan como puntos en un espacio de (por 
ejemplo) dos dimensiones, que surgieron de una 
combinación de las originales (adaptado de Jong- 
man et al., 1995). También se comprende que el 
ACP muestra (si los datos así lo requieren) un gra- 
diente indirecto entre las unidades de observación. 
Pero el Análisis de Redundancia, utilizado como 
complemento con variables ambientales, mostrará 
un gradiente directo (Jongman et al., 1995). 


Analizando el Ejemplo 1. 

La figura 3 representa el biplot del ACP. Allí se 
observan las unidades de observación representa- 
das por círculos y las variables, por triángulos. A 
su vez las variables están unidas al centro (el ce- 
ro de ambos ejes). En este ejemplo se ordenaron 
17 individuos tomándoles cinco variables a cada 
uno. El gráfico muestra que las unidades 2, 6 y 13 
se hallan en un extremo del eje de mayor variabi- 
lidad, mientras que las unidades 7 y 14 se hallan 
en el extremo opuesto. Esto sugiere que estas uni- 
dades estan en lugares “diametralmente opues- 
tos”. No se observan “grupos” definidos, sino un 
gradiente de unidades de observación. El segun- 
do eje de mayor variabilidad arroja a las unidades 
1,2,7, 13 y 17 en un extremo y la unidad 4 en 
el otro. 

Por su parte es muy pequeño el ángulo forma- 
do entre las variables ala y cuerpo lo que muestra 
su altísima correlación. Antena y ojos también se 
hallan correlacionadas, no así las dos primeras 
con las dos últimas, que forman un ángulo apro- 
ximado a 90 grados. Cuando el Componente 
Principal 1 aumenta, Ala y Cuerpo disminuyen. 
Fémur 3, por su parte está también correlaciona- 
da al Componente 1, pero no correlacionada al 2, 
ya que la “sombra” que produce en éste es muy 
pequeña. Este análisis y otras observaciones le 
servirán al autor para generar hipótesis sobre la 
disposición de las unidades y las variables. El por- 
qué algunas son más parecidas a otras, por qué se 
produce ese gradiente, etc. 

Además del gráfico se obtiene la información 
numérica. El primer Componente Principal (por 
ejemplo) arrojó un autovalor de 2,16, que re- 
presenta un 60 % de la variabilidad total (suma 
de autovalores=3,6). El segundo eje posee un 
autovalor de 1,08, que representa un 30 % de la 
variabilidad. Es decir que en los dos primeros 
ejes se captura un 90% de la variabilidad de los 
datos. 


Ejemplo 2: Análisis de Correspondencia (AC) 


Se quiere ordenar distintos puntos de muestreo 
en un campo de maíz, sobre la base de la fauna 
de artrópodos del suelo. En este caso tenemos uni- 
dades de observación (puntos), y a cada una de 
ellas se le toman muchas variables (cada especie). 
Entonces se puede hacer el intento por buscar un 
autovector que maximice la dispersión entre las 
unidades (puntos) para conocer cuáles son más 
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Figura 4: Gráfico (Biplot) de un Análisis de Correspondencia, donde figuran las unidades de observación (pun- 


tos) y las especies tomadas como variables (triángulos). 


parecidos entre sí, dicho de otro modo: los pun- 
tos del borde del campo serán distintos a los del 
centro?. Pero el número de individuos de cada es- 
pecie es un conteo, que no posee distribución 
normal. Para este caso se recomienda utilizar una 
distancia denominada chi cuadrado, que se basa 
en las frecuencias esperadas que se calculan en 
las tablas de contingencia (como en el conocido 
test Chi cuadrado de independencia). Después de 
encontrar esas distancias, el análisis traza el pri- 
mer vector, luego el segundo y así sucesivamen- 
te. La interpretación de ésto es la misma que en 
el ACP. La diferencia consiste en que se analiza 
tanto el gráfico de las unidades en el espacio de 
las variables como el de las variables en el es- 
pacio de las unidades. Entonces se superponen 
los dos gráficos, obteniendo uno compuesto en 
este caso por puntos y especies llamado biplot 
(Figura 4). 

Como la distancia ya no es euclídea ni repre- 
senta la varianza entonces no se puede hablar de 
la varianza que explican los ejes y la variabili- 
dad explicada entonces se denomina inercia ex- 


plicada. Este análisis es conocido también como 
Reciprocal Averaging (McGarigal et al., 2000). 

Un análisis posterior al AC es el Análisis de 
Correspondencia Canónica, el equivalente al 
Análisis de Redundancia en este marco. Se gene- 
ra un gráfico Triplot, que posee las unidades, las 
variables y las variables anexas utilizadas. 

Contrariamente a las suposiciones de ACP, el 
Análisis de Correspondencia asume que la rela- 
ción entre las variables y los gradientes ambien- 
tales es de tipo unimodal, de este modo se so- 
luciona el problema de los gradientes “largos”. 
Pero del mismo modo que ocurre en ACP, tiene 
un inconveniente: en el segundo eje se produce 
un “artilugio” matemático que deforma la orde- 
nación, es un efecto de curvatura donde se 
cambia la verdadera distancia entre unidades 
de observación, denominado efecto herradura 
(Jongman et al., 1995). 


Analizando el Ejemplo 2: 
La figura 4 representa el biplot del AC. Allí se 
observan las unidades de observación represen- 
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tadas por círculos (sitios o puntos de muestreo) 
y las variables, por triángulos (especies). En es- 
te ejemplo se ordenaron cinco puntos de mues- 
treo basadas en cuatro especies. El gráfico 
muestra que los puntos A y E se encuentran en 
posiciones diametralmente opuestos con res- 
pecto al primer eje de mayor variabilidad. A su 
vez el punto A se encuentra “asociado” a la es- 
pecie 3 y el punto E a la especie 4. El segundo 
eje de mayor variabilidad separa a estos dos 
puntos de los sitios B, C y D. A su vez también 
se pueden pensar en las asociaciones entre es- 
pecies, las especies 1 y 2 forman un grupo que 
se halla relacionado a los tres sitios que están 
en la porción superior del gráfico. 

De la información numérica obtenida se des- 
prende que el primer autovalor es igual a 0,82, 
mientras que el valor del segundo es de 0,42. El 
primero consigue atrapar una variabilidad (iner- 
cia) del 75 %, mientras que el segundo toma un 
19% de ésta. Entre ambos se consigue explicar el 
94 % de la variabilidad de los datos. 


Ejemplo 3: Análisis de Correspondencia De- 
tendenciado (ACD) 


Se está trabajando en el efecto de la contamina- 
ción sobre la comunidad de insectos bentónicos. 
Entonces se intenta ordenar distintos sitios sobre la 
base de las variables (especies de insectos). 

El Análisis de Correspondencia Detendencia- 
do (Hill & Gauch, 1980) es una técnica de or- 
denación que quita el efecto herradura explica- 
do anteriormente. Ha sido muy utilizado en los 
trabajos científicos de las últimas dos décadas. 
El primer programa de computación que reali- 
zaba este análisis se llamó Decorana por lo que 
se ha generalizado el análisis con ese nombre. 
Utiliza igualmente que el Análisis de Corres- 
pondencia una distancia chi cuadrado, pero a 
los ejes los particiona en segmentos que “desar- 
man” la herradura. La interpretación de los ejes 
es la misma que en Componentes Principales y 
Correspondencia: se busca el eje de mayor va- 
riabilidad y se intenta absorver en la menor 
cantidad de ejes posibles la mayor variabilidad 
de los datos originales, que sigue llamándose 
inercia explicada. 

Además para entender a los ejes como gra- 
dientes ambientales, se presenta un Analisis de 
Correspondencia Detendenciado Canónico, que 
grafica un Triplot. 


Ejemplo 4: Análisis de Coordenadas Principa- 
les. (ACoP) 


Un especialista en genética posee varias varia- 
bles de diferentes unidades de observación, pero 
él sabe que se ha llegado a un acuerdo y la mejor 
distancia para medir la similitud o disimilitud en- 
tre los individuos es un índice basados en distan- 
cias genéticas. Entonces le interesa estudiar cómo 
se ordenan sus unidades sobre la base de esas dis- 
tancias, no le interesa ni la Euclidea (como ACP) 
ni Chi cuadrado (como AC ó ACD). Entonces se 
puede buscar el mayor autovector que maximice 
la dispersión de datos con otra distancia?. La res- 
puesta es afirmativa, el Análisis de Coordenadas 
Principales lo hace. Cualquier medida de distan- 
cia propuesta, aún alguna que haya “inventado” 
el investigador puede ser utilizada. De esta forma 
el ACP pasa a ser un caso particular de AcoP para 
la distancia euclídea y el AC otro caso particular 
para la distancia Chi cuadrado. Así el ACoP am- 
plía el análisis para aquellas distancias que esten 
probadas ser más representativas de las similitu- 
des para algunas áreas de estudio. Como ejem- 
plo, Anderson & Willis (2003) aseguran que en 
algunas áreas de Ecología es preferible utilizar es- 
te análisis con las medidas de Bray-Curtis o de 
Kulczynski. 

Como hemos estado viendo en los casos ante- 
riores, aquí se podrían pensar en análisis ulterio- 
res: El Análisis de Coordenadas Principales Canó- 
nicas busca restringir los resultados a otros datos 
por ejemplo ambientales. 

Un sinónimo de ACoP es Análisis de Escala- 
miento Multidimensional (Multidimensional Sca- 
ling). Con ese nombre se conocieron a técnicas 
que originalmente se realizaron para hacer “ma- 
pas” a partir de matrices de distancia. En ese mar- 
co se intenta priorizar las coordenadas principa- 
les de manera que se produzcan la menor distor- 
sión con respecto a las distancias originales. La 
bondad de ajuste del método la calcula median- 
te un valor llamado Stress (u otro llamado Sstress) 
que da una idea de la distorsión ocurrida. Por su 
parte se puede tener un Escalamiento Multidi- 
mensional Métrico (Metric Multidimensional Sca- 
ling) que trabajan con la verdadera magnitud de 
las distancias o Escalamiento Multidimensional 
No Métrico (Non Metric Multidimensional Sca- 
ling). Esta es una ordenación que se puede hacer 
con datos que son no normales, arbitrarios, dis- 
continuos o cuestionables. Está basado en distan- 
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cias, pero no utiliza la magnitud de la distancia 
sino sólo el número de orden de las mismas (dis- 
tancias ordenadas o rankeadas). 


OTROS ANÁLISIS 


Análisis Factorial (AF) 

Recordemos que en el ACP, cada componente 
es una combinación lineal de variables. En el 
Análisis Factorial se invierte esta idea: se asume 
que cada variable es una combinación lineal de 
factores desconocidos más un residuo o error no 
medido. De modo que: 


X = Mi + li Fit lio Fo +... +him Fm + e1 








Xp = Up + lor Fit lo2 Fo +... tlpm Fm + ep 


donde Xi representa cada variable, ui es una 
ordenada al origen, l; son las pendientes, F; facto- 
res, e¡ error. 

Esos factores son no observables y tienen alea- 
toriedad. 

Este análisis ha tenido muy poca utilización en 
las Ciencias Biológicas. Se han conocido diversos 
ejemplos tanto en Psicología, como en Geología 
(Davis, 1986). En este momento se lo está revalo- 
rizando, ya que establece las bases para otros 
análisis denominados Modelos de Ecuaciones Es- 
tructurales (Structural Equation Models). Estos 
MEE son herramientas que permiten contrastar hi- 
pótesis sobre relaciones causales en datos obser- 
vacionales. Presentan una alternativa a los diseños 
experimentales sustituyendo al control experi- 
mental por un control estadístico. Iriondo et al., 
2003 provee una excelente explicación aplicada a 
datos biológicos. Para detalles teóricos ver Ta- 
bachnick & Fidell (1996). 


Procrustes 

Es una técnica para comparar si son similares 
los resultados de dos o más ordenaciones realiza- 
das sobre las mismas unidades de observación. 
Este método deja fija una de las ordenaciones y 
corre, estira y rota la/s otras, de manera tal que la 
distancia entre los puntos ordenados por los dis- 
tintos sistemas sea el mínimo posible (Digby & 
Kempton, 1991). Además esto se complementa 
con un análisis de permutaciones de manera tal 
de obtenerse una probabilidad que esa “semejan- 
za” entre las ordenaciones pueda deberse sólo al 


azar o si el patrón de semejanza es significativo. 
Este tipo de análisis se esta utiliza con frecuencia 
en los análisis morfométricos conocido como 
“landmark”. 


Como corolario quiero expresar que este tra- 
bajo intentó presentar una sencilla explicación y 
puesta al día de los métodos de ordenación más 
comúnmente utilizados en las Ciencias Biológi- 
cas en general y en la Entomología en particular. 
Debiera ser tomado con ese objetivo y así servir 
como un nexo o introducción para que los inte- 
resados arriben a textos de mayor (y mejor) en- 
vergadura en pos de mayor claridad. 
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